#Google Gemini
Google2025「復仇爽文」大結局!從至暗時刻到王者歸來
【新智元導讀】年初被唱衰,年底卻直接封神:2025年的Google,把AI圈寫成了一本爽點密集的復仇小說!Gemini 3、Nano Banana、諾獎、晶片、智能體齊上陣:矽谷AI鐵王座還是Google的!回顧2025年,對於Google來說,可謂是一部跌宕起伏的「復仇爽文」。如果說年初外界還在唱衰這家巨頭「大象難轉身」,那麼到了年底,Google用實力上演了一出從被打落神壇,到揚眉吐氣、重回巔峰的好戲。尤其是年底這波Gemini 3和Nano Banana的組合拳,簡直是降維打擊!不僅穩穩佔據了LMArena的榜首,更是在推理和多模態能力上打得對手OpenAI一個措手不及。Google在向世界宣告:矽谷的AI鐵王座,依然姓Google。就在剛剛,GoogleAI掌門人們:首席科學家Jeff Dean、DeepMind CEO Demis Hassabis以及負責技術與社會的SVP James Manyika三位重量級人物聯名發佈了Google2025年度總結。而且也給AI這一年定了一個基調:這一年,是屬於AI智能體、深度推理與科學探索的大成之年。Google這一年把「科研」變成「現實」,在8大領域實現了全面突圍。以下是Google這一年「秀肌肉」的高光時刻:模型層面的「碾壓」:Gemini 3重新定義天花板Google今年的策略非常狠:「下一代的Flash模型要比上一代的Pro模型更強」。從3月發佈的Gemini 2.5到11月震驚業界的Gemini 3,Google徹底解決了推理能力的瓶頸。Gemini 3不僅在「人類終極考試」這種變態難度的基準測試中拿下了突破性高分,更通過Gemini 3 Flash實現了性能與成本的完美平衡。現在的Google模型,既能深思熟慮(DeepThink),又能快如閃電。開發者的「新紀元」:Google Antigravity如果說以前的Copilot只是幫你補全程式碼,那麼Google今年推出的Google Antigravity則是徹底顛覆了軟體開發。這不是工具,而是真正的「Agent(智能體)」。配合非同步程式設計Agent Jules,現在的開發者擁有的不再是一個助手,而是一支隨叫隨到的專家團隊。創意工具的「爆發」:Nano Banana 與Veo在生成式媒體領域,Google今年簡直是「玩嗨了」。Nano Banana Pro和Veo 3.1的出現,讓圖像編輯和視訊生成進入了專業級時代。無論是通過Nano Banana進行原生的圖像修改,還是用MusicAI Sandbox輔助音樂創作,Google正在把頂級創意能力下放給每一個人。科學界的「諾獎收割機」這或許才是Google真正的護城河!2025年,AlphaFold團隊不僅迎來了5周年,更見證了Hassabis等人憑藉它斬獲諾貝爾獎的榮耀。不僅如此,Google員工Michel Devoret亦在今年榮獲諾貝爾物理學獎。從AlphaFold到能解決數學奧賽金牌題目的DeepThink,再到AI科學家,Google證明了AI不僅僅是聊天機器人,更是解開宇宙奧秘的鑰匙。硬核基建:Ironwood與AlphaChip當別人還在搶GPU的時候,Google已經用AI來設計AI晶片了。今年推出的Ironwood TPU專為推理時代打造,而這背後功臣正是AlphaChip設計方法。軟硬一體的實力,讓Google在能效和算力上擁有了難以複製的優勢。具身智能:AI擁有了身體Google不僅讓AI思考,還讓它「動」了起來。Gemini Robotics 1.5和Genie 3的發佈,標誌著通用世界模型的新前沿。AI智能體正在走出螢幕,進入物理世界和虛擬環境,開始真正地理解和操縱世界。全球影響力:預測未來,拯救生命在應用層面,Google的格局打開了。最新的Weather Next 2模型能以驚人的精度預測天氣,洪水預報覆蓋了全球20億人。從NotebookLM的深度研究功能到Pixel 10的AI體驗,Google正在把「黑科技」變成每個人手中的「水電煤」。還有GoogleEarth AI,最先進的地理空間AI模型。安全與責任:走得快,更要走得穩在狂飆突進的同時,Google依然保持了克制。Gemini 3被稱為Google迄今為止最安全的模型,通過了最全面的紅隊測試。隨著模型能力持續增強,不斷升級工具鏈、資源體系與安全框架,以預見並降低潛在風險。Gemini 3正是這一理念的實踐典範:作為Google迄今最安全的模型,它經歷了公司AI模型中最為全面的安全評估體系。更著眼長遠,探索通往通用人工智慧的負責任路徑,著重提升風險應對能力、完善主動風險評估機制,並與更廣泛的人工智慧社群開展協作。2024年是鋪墊的草蛇灰線,2025年才是一切的爆發。這份涵蓋了從底層晶片、核心模型到頂層應用、科學探索的成績單,我們不得不承認:那個熟悉的、令對手窒息的Google,回來了!看來,2026年,好戲才剛剛開始。Google2025年AI年度回顧一月新年伊始,Google在Gemini、Android、GoogleTV和教育工具上推出了一系列更新。推出了由Gemini驅動的更強大的Android助手:提升手機端的AI體驗,讓助手更懂你的需求。公佈了針對三星GalaxyS25系列及更多裝置的Android系統更新:通過系統底層最佳化,讓新裝置更好地運行AI功能。發佈了面向2025年的全新Google教育工具:推出了一系列新功能,旨在助力教師教學與學生學習。在CES上展示了Google TV的最新功能和改進:利用AI技術提升內容推薦精準度,改善家庭娛樂體驗。在Gemini應用中推出了Gemini 2.0 Flash版本供使用者嘗鮮:以更快的速度和更低的延遲,讓使用者體驗新一代模型的響應能力。二月本月重點展示了AI如何在求職和科學研究等領域帶來實質性改變。宣佈Gemini 2.0模型正式向所有使用者開放:全面放開存取權,讓每個人都能使用Google最新的基礎模型。Gemini Code Assist程式設計助手現在免費提供:降低開發者門檻,利用AI免費輔助編寫和偵錯程式碼。推出了一項新實驗功能,利用AI幫助人們探索更多職業發展的可能性:通過分析使用者技能與興趣,智能推薦潛在的職業路徑。發佈了一款專為科學家設計的新型AI系統:該系統能輔助科學家提出假設、設計實驗並規劃研究路線。iOS使用者現在可以在瀏覽網頁時使用Lens搜尋螢幕上的內容:打破應用壁壘,在蘋果裝置上也能體驗「所見即搜」的便捷。三月搜尋中的AI模式(AI Mode)首次亮相,同時發佈了Gemini 2.5和Gemma 3。發佈了當時Google最智能的AI模型Gemini 2.5:在推理能力和多模態理解上取得了顯著突破。推出了Gemma 3,這是可在單個GPU或TPU上運行的最強模型:為開源社區和端側開發提供了極其強大的性能支援。擴展了AI Overviews功能,並正式引入了「AI模式」:在搜尋中處理更複雜的查詢,提供深度解答而非簡單連結。Gemini應用上線了多項新功能,供使用者免費試用:包括更豐富的檔案分析能力和互動方式。推出了利用Gemini進行協作和創意創作的全新方式:在Workspace等工具中深度整合,提升團隊協作效率。四月硬體與雲端算力的大幅升級,為AI時代奠定基石。發佈首款專為「推理時代」打造的TPU Ironwood:在Google Cloud Next大會上亮相,大幅提升AI推理效率。推出了Google Vids的全新AI視訊生成功能:Workspace使用者可利用AI快速生成工作匯報視訊。發佈AI驅動的網路安全防禦系統:利用大模型即時檢測並防禦複雜的網路攻擊。CloudAssist雲端助手能力升級:幫助企業使用者更智能地管理雲資源和排查故障。發佈了Imagen 3的圖像生成增強版:在生成圖片的細節和文字渲染能力上達到新高度。五月Google I/O開發者大會召開,發佈了AI電影製作工具Flow和Veo 3。回顧Google I/O 2025,展示從研究到現實的跨越:總結了AI技術如何全面落地到Google的產品生態中。推出了由Veo 3驅動的AI電影製作工具Flow:為創作者提供好萊塢等級的AI視訊生成和編輯能力。推出了Google AI Ultra訂閱服務:整合了Google最頂尖的模型和功能,一站式滿足專業使用者需求。在購物中引入AI模式,支援虛擬試衣:利用生成式AI讓使用者在購買前看到衣物穿在自己身上的效果。搜尋中的AI進一步進化,轉向提供智能服務:不僅僅是尋找資訊,而是直接幫使用者完成任務。六月開發工具與移動作業系統的智能化革新。發佈Gemini CLI,打造開源AI智能體工具:讓開發者能在命令列中直接呼叫Gemini建構智能體。正式發佈Android 16作業系統:系統底層深度整合AI,提升流暢度與個性化體驗。推出了SearchLive即時互動功能:支援使用者與搜尋引擎進行即時的語音對話和多模態互動。宣佈擴展Gemini 2.5模型家族:推出了針對不同側重領域(如程式碼、數學)的微調版本。展示了Gemini 2.5在高級音訊對話上的能力:實現了更自然、更具情感的語音互動體驗。七月AI功能深入日常,讓相簿和郵件變得更「聰明」。在Gemini中上線了照片轉視訊功能:利用AI將靜態照片瞬間轉化為生動的視訊片段。宣佈搜尋將迎來更高級的AI能力:增強對長尾問題和模糊需求的理解能力。利用搜尋中的AI模式提供學習新途徑:為學生提供定製化的學習計畫和知識點解析。Gmail推出「管理訂閱」新功能:智能識別並一鍵清理不需要的郵件訂閱,淨化收件箱。為Pixel使用者推送了驚喜功能更新(PixelDrop):通過軟體更新為舊款Pixel手機帶來了最新的AI特性。八月硬體盛宴,Pixel 10系列攜手全新AI體驗登場。正式發佈Pixel 10系列手機:搭載最新TPU晶片,是首款為「全天候AI」設計的終端裝置。Gemini圖像編輯功能迎來重大升級:引入更精準的局部重繪和風格遷移能力。宣佈向大學生免費提供GoogleAI工具:投入資金與資源,普及AI教育,賦能下一代創新者。在Gemini應用中上線DeepThink功能:讓模型在回答覆雜問題前進行更深度的邏輯推理。推出了全新的AI驅動航班搜尋工具FlightDeals:智能預測票價趨勢,幫使用者鎖定最佳出行時機。九月Chrome瀏覽器重構,AI開始接管瀏覽器體驗。揭秘Chrome瀏覽器全新AI功能背後的技術:解釋了端側小模型如何讓瀏覽器更快、更安全。利用AI重新構想Chrome瀏覽器:推出智能標籤頁管理、網頁摘要和寫作輔助等功能。介紹了通過SearchLive獲取即時幫助的方式:展示了在旅行、維修等場景下視訊通話式搜尋的威力。Android更新帶來更智能的寫作與分享:輸入法不僅能糾錯,還能根據語境自動補全長句。最新PixelDrop包含Material 3 Expressive升級:UI設計語言進化,帶來更靈動、更具表現力的互動動畫。十月具身智能與醫療AI取得突破,Gemini學會操作電腦。推出了Gemini 2.5 ComputerUse模型:模型現在可以像人一樣查看螢幕、移動游標、點選按鈕,執行複雜操作。發佈Veo 3.1模型並提升Flow功能:視訊生成的連貫性和時長進一步提升,支援更細粒度的控制。發佈專為Gemini建構的GoogleHome裝置:智能音箱和攝影機具備了更強的本地AI處理能力。分享Gemma模型幫助發現癌症治療新路徑:展示了開放模型在生物醫學領域的巨大科研價值。宣佈Nano Banana 模型應用更廣:這款輕量級圖像模型被整合到搜尋、NotebookLM和相簿中,提供極速體驗。十一月年度重磅,Gemini 3橫空出世,開啟智能新紀元。宣佈Gemini 3的誕生:Google迄今為止最強大的AI模型,具備前所未有的多模態推理能力。推出了更專業的Nano Banana Pro模型:在保持速度的同時,大幅提升了圖像生成的藝術質量和逼真度。面向開發者開放Gemini 3:API同步上線,邀請全球開發者共同建構基於新模型的下一代應用。Gemini 3為Gemini應用帶來新功能:普通使用者也能立即體驗到新模型帶來的更聰明、更人性化的對話。Google地圖導航功能通過Gemini獲強力升級:提供更直觀的實景導航和基於語境的地點推薦。十二月(December)以速度極快的Gemini 3 Flash和年度熱搜收官。推出了專為速度打造的Gemini 3 Flash:在保持高智商的同時,將響應延遲降至極低,適合即時應用。Gemini 3 Flash開始在全球搜尋中推出:讓每一次搜尋都能獲得瞬間生成的AI智能摘要。發佈了2025年度熱搜報告:回顧全年搜尋趨勢,展現AI如何重塑人們獲取資訊的方式。Android 16新更新幫助使用者組織資訊:利用端側AI自動整理手機中的通知、檔案和照片。將最先進的Gemini翻譯能力引入Google翻譯:實現了同聲傳譯等級的即時翻譯效果,打破語言障礙。 (新智元)
GoogleAI逆襲背後的頭號功臣
【新智元導讀】Google AI 在 2025 年下半年打了個漂亮的翻身仗,用 Nano Banana 和 Gemini 3 Pro 這兩款殺手級模型,從 OpenAI 手下搶走了大量使用者。背後的功臣,對內聲名顯赫,對外默默無聞。他是誰?他有著怎樣傳奇的故事?在Google最危險的時刻,一位不為外界熟知的中年人在內部臨危受命。他引領團隊開發出爆紅的AI應用,讓GoogleAI業務起死回生,甚至一度打敗 ChatGPT 登頂應用榜。他是誰?他的故事揭示了Google如何用創新和責任心,在 AI 競賽中重奪主動權。GoogleAI逆襲背後的「無名」功臣2025 年 8 月的一個深夜,Google資料中心的警報突然頻繁響起——伺服器負載飆升至前所未有的水平。工程師們開玩笑說,再這麼下去,他們特製的TPU晶片恐怕都要被燒化了。引發這一切的,是Google Gemini 應用中新上線的圖像生成功能「Nano Banana」。這個功能可以將多張照片融合成獨特的數字人偶,意外地在全球引爆了使用者熱情。短短幾天裡,海量使用者湧入嘗鮮,生成的圖片數量迅速突破數十億張,直接把Google的伺服器「烤」得冒煙。Google被迫緊急對 Nano Banana 的使用加以限制,以免後台基礎設施真的撐不住這股熱潮。然而,這場近乎「失控」的走紅非但沒有讓Google高層惱火,反而令整個公司為之振奮——Gemini應用終於一戰成名。在8月底功能推出後的短短一個月內,Gemini 累計生成圖像超過 50 億張,甚至一度超越 OpenAI 的 ChatGPT 躍居蘋果 App Store 下載榜首。而站在這一切背後的操盤手,正是一位在公司內部聲名顯赫,對外低調神秘的中年人:Josh Woodward。42 歲的 Josh Woodward 並非矽谷家喻戶曉的名字,但在Google內部,他幾乎是傳奇般的存在。這位出生於美國中部奧克拉荷馬州的產品經理,2009 年通過實習進入Google,從此一路在各種創新項目中嶄露頭角。早年間他曾參與建立Google最初幾代 Chromebook 筆記型電腦,聯合創立了面向新興市場使用者的「下一個十億使用者(NBU)」計畫,並主導了 Google Pay 支付服務的拓展。豐富的履歷和雷厲風行的作風,使他在內部備受推崇。正因如此,當Google在生成式AI領域感到空前的壓力時,管理層想到了 Woodward。2025 年 4 月,Google AI 戰線進行了一次關鍵人事調整:一直埋頭於實驗室業務的 Woodward 被提拔為 Gemini 應用負責人,接過公司AI戰略的帥印。當時,OpenAI 憑藉 ChatGPT 在 AI 領域風頭正勁,行業專家紛紛預言使用者將從傳統搜尋轉向AI應用。Google痛感自己的搜尋霸主地位受到威脅,加上母公司 Alphabet 一季度股價暴跌約兩成,亟需一場勝利來重振士氣。接任後的 Woodward 深知責任重大,他一手主管 Gemini 應用業務,同時仍領導著Google旗下的新興技術試驗田——Google Labs,肩負起在 AI 競賽中為Google開闢新賽道的雙重任務。「TPU 快被燒化了!」 AI爆款的誕生Woodward 上任後不久,就迎來了大顯身手的機會。這款名為 Gemini 的 AI 應用原本籍籍無名,卻因為一個名叫「Nano Banana」的新功能而聲名鵲起。Nano Banana 最初只是團隊的一次創意迭代:使用者可以上傳多張自己的照片,由AI將其合成為一個獨一無二的數字玩偶形象。沒想到這個充滿趣味的功能一推出就風靡全球,伺服器上一時間請求暴增。據Google AI 基礎架構負責人 Amin Vahdat 回憶:「我們的TPU晶片組當時幾乎要被烤化了!」。團隊不得不暫時為 Nano Banana 設定使用上限來緩解壓力。然而,這次「小危機」凸顯的正是巨大的機會:使用者對個性化AI創作的渴求超出了所有人的想像。Woodward 敏銳地意識到這正是 Gemini 突圍的契機。在他的推動下,團隊連夜擴容後台算力,全力保障這一功能的穩定運行。事實證明,這場硬體「險情」恰是 Gemini 騰飛的起點——到 9 月底,Gemini 應用累計生成的圖像已突破 50 億張。憑藉 Nano Banana 的爆紅,Gemini 應用的月活躍使用者從 3 月的 3.5 億飆升到 10 月的 6.5 億。更令Google揚眉吐氣的是,在 Nano Banana 帶動下,Gemini 在蘋果 App Store 的下載量一舉超越了 ChatGPT,登上免費應用榜冠軍。Google用了不到半年時間,就實現了從 AI 跟隨者到市場領跑者的驚人逆轉。Alphabet 公司的股票也隨之止跌回升,到年底累計上漲了 62%,成為當年美股中表現最亮眼的科技巨頭之一。這一切都令業界震動:Google似乎找回了久違的速度與激情,而推動公司完成這次AI領域「逆襲」的關鍵人物,正是 Woodward。對於 Gemini 的成功,Woodward 保持著難得的清醒與冷靜。他深知,在快速推進 AI 創新的同時,更需要慎重考慮技術可能帶來的負面影響。今年 11 月,Google發佈最新的大模型 Gemini 3,引發行業轟動。在接受媒體採訪時,Woodward 興奮地表示「我從來沒有像現在這樣覺得工作充滿樂趣」 ——AI 模型的強大能力讓各種天馬行空的產品創想成為可能。但身為掌舵者,他也時刻警惕著技術的雙刃劍。此前,他就在紅杉資本的播客節目中坦言,AI 的進步正處於一個足以「改變時代」的關鍵節點,這種改變「可能是向善的,也可能是適得其反的」。事實證明,Nano Banana 功能在爆紅的同時也一度引發爭議:有使用者使用它根據提示詞合成援非人道主義場景的形象時,生成的畫面卻是身著便服的白人女性周圍圍繞著非洲黑人兒童,引來種族刻板印象的批評。這類爭議讓 Woodward 更加意識到,AI 產品在追求創新的同時絕不能忽視社會責任。他要求團隊迅速最佳化演算法,避免再次出現類似偏見輸出,並強調任何 AI 新功能上線前都要經過更嚴格的審查。Google內部也在他的倡議下設立專門機制,評估熱門AI應用可能引發的道德和信任問題,力求在保持高速創新的同時守住「不會傷害使用者信任」的底線。Google在制定AI產品戰略時相當克制理性。Woodward和他的上級、DeepMind CEO 哈薩比斯(Demis Hassabis)商議後,有意避開了時下火熱但容易引發倫理爭議的「AI情感伴侶」方向,而是堅持將Gemini定位為提升工作效率的超級工具。Google內部給Gemini制定的考核指標並非使用者粘性或時長,而是每天幫助使用者完成了多少實際任務。這樣的取捨背後,是Woodward對於AI角色邊界的深思——AI最重要的價值應在於賦能人類,而非讓人沉迷於虛擬陪伴。當下,生成式AI正加速滲透進人們生活的方方面面,海量AI生成內容充斥網路,真偽難辨。Woodward比任何人都清楚,Google必須加倍謹慎,既要跑贏競賽,又不能因魯莽而丟掉使用者多年來對Google品牌的信任。因此,他在業務衝鋒的同時,以身作則地為團隊敲響警鐘:「我們正處在一個技術巨變的關口,這種變革將影響好幾代人。身處這個位置,我們必須確保它被用來促進善意,而非滋生危害。」敢想敢幹 「讓他們盡情去做」Gemini應用的成功並非偶然。事實上,Woodward上任之前就在Google內部孵化出多款頗具前景的AI產品。其中最出名的,當屬AI筆記助理NotebookLM。它最初只是Google Labs團隊一個默默無聞的試驗項目——資深產品經理Raiza Martin利用工作之餘的「20%時間」開發了一個名為Project Tailwind的原型:它可以讓使用者上傳文件、PDF甚至視訊,然後由AI提煉要點、生成摘要或見解。Woodward對這個創意一眼相中,大力支援團隊繼續打磨。為了把這個項目做成真正貼近使用者需求的產品,他大膽採取了一系列「非常規」舉措,打破了Google內部的慣例和層層壁壘。首先,Woodward從外部網羅來一位出人意料的「臨時盟友」——科技作家史蒂文·約翰遜(Steven Johnson)。Johnson在業界小有名氣,出版過多本暢銷書,卻從未在任何公司任職過。2022年,Woodward讀到Johnson關於AI與創意的文章後深受啟發,竟主動發出邀請,請他以訪問學者的身份加入Google Labs,共同探索如何用AI增強人類的創造力。對於這種「不按常理出牌」的合作模式,Woodward的想法很簡單:「讓四五個工程師和一個真正的作家碰在一起,看看會產生什麼火花」。在他的牽線下,Johnson開始兼職參與Project Tailwind,為團隊提供作家視角的輸入,分享職業寫作者整理資訊的工作流。工程師們在一旁觀察他的使用習慣,不斷改進產品功能。一段時間磨合後,Johnson深深投入其中,最後乾脆接受了Woodward的邀請轉為全職,擔任NotebookLM團隊的「創作總監」。這樣「破圈」的人才能夠加盟Google,靠的正是Woodward勇於創新用人的魄力。不僅如此,為了快速完善NotebookLM,Woodward還鼓勵團隊主動擁抱外部使用者社區的力量。在產品開發早期,團隊希望收集真實使用者的反饋來改進產品。按常規,Google內部有自己的論壇和郵件列表,可以用來做封閉測試。但年輕的產品經理Raiza更傾向於直接去主流社群與使用者互動,她選擇了當下開發者和AI愛好者云集的平台——Discord聊天伺服器。這在當時引起了一些內部爭議:畢竟Google一向偏好使用自家產品,很多高管甚至不知道Discord為何物。有管理人員質疑:「為什麼不用Google Meet會議或者內部群組?」對此,Woodward全力支援Raiza的提議。他乾脆對團隊撂下一句:「讓他們盡情去做吧(Let them cook)!」在他的力挺下,NotebookLM項目組順利搭建了Discord伺服器,與第一批種子使用者直接交流。這種開放姿態很快收穫了回報:借助社群力量,NotebookLM在打磨階段就吸引了大批AI發燒友的關注,產品不斷根據反饋迭代升級。到2024年底,該Discord社區已匯聚了超過20萬名成員,成為Google史上最活躍的產品使用者社區之一。很多團隊成員坦言,如果沒有Woodward頂住內部壓力允許他們「破例」用第三方平台,這款產品不可能進步得如此快、如此好。終於,2023年5月,Woodward帶著打磨成型的NotebookLM走上Google一年一度的I/O開發者大會舞台。在Google雲CEO托馬斯·庫裡安的主題演講結束後,Woodward出人意料地現身台上。他先是賣了個關子,向台下觀眾介紹說:「我們在幾周內用五名工程師拼出了一個新點子,叫作Project Tailwind。我自己的母校俄克拉荷馬大學師生也參與了內測。大家想看看它能做什麼嗎?」隨後,他現場操作筆記應用,匯入幾篇文件。不出幾秒,螢幕側欄便自動生成了這些材料的關鍵詞和延伸提問。他隨手點開「引用來源」按鈕,興奮地介紹道:「這個功能是我最喜歡的——AI會標註出每條答案背後的出處。 」短短幾分鐘的演示贏得滿堂喝彩。NotebookLM就此進入公眾視野,並在隨後數月向廣大使用者開放試用,上線不久便廣獲好評。Google很快為其加入了支援音訊、視訊內容的分析功能,讓這款AI筆記助手更趨完善。NotebookLM的成功不僅證明了Woodward識人用人的獨到,也驗證了他推動內部「減小阻力」所取得的成效。在官僚體系龐大的Google公司,許多創新想法往往困於流程冗長、部門掣肘。為此,Woodward在Google Labs內部設立了一個特別機制,員工如果遇到體制上的「絆腳石」可以提交一個代號為「Block」的工單,由專門團隊迅速協調資源排障。NotebookLM項目在籌備上線時一度面臨算力不足的問題,Woodward 便通過這一機制火速調撥了更多TPU算力支援,確保產品性能萬無一失。據團隊工程師回憶,有了「Block」系統的保駕護航,他們再也不用為內部審批耗費精力,可以心無旁騖地專注於產品研發。「有這樣一位負責人幫我們清理那些惱人的障礙,我們才能真正將精力放在使用者身上。」Google Labs 的一名軟體工程師 Usama 感嘆道。小細節,大作為Woodward 領導風格中另一個令人稱道的特點,是他對「細節決定成敗」的高度重視。擔任 Gemini 和 Google Labs 負責人後,他發起了一項名為「Papercuts」(紙割傷)的內部計畫,專門蒐集和快速修復那些雖然不至於致命、但影響使用者體驗的「小傷口」。在 Woodward 看來,這些細枝末節的改進往往最能打動使用者,卻常被大公司忽視。有使用者抱怨在 Gemini 聊天時無法中途切換大模型而不重新開始對話,Woodward 知道後立刻催促工程師最佳化。不久他就在自己的 X 帳號上驕傲地宣佈:「Papercut 已修復:現在你可以在 Gemini 應用的對話中途切換模型而無需重新啟動會話了。」這條動態下面,許多使用者紛紛留言點贊,感謝他傾聽並解決了困擾自己的「小問題」。事實上,親自聆聽使用者聲音、持續打磨產品細節,幾乎已經成為 Woodward 工作的日常。身為公司高管,他卻常常一頭紮進社交媒體的一線陣地,在 X 和 Reddit 上直接回答使用者提問、收集吐槽反饋。業界人士形容這在科技巨頭中相當少見——一位負責核心產品的副總裁竟然親自在論壇上當「客服」,甚至把使用者直言不諱的批評意見轉發給開發團隊要求改進。但在 Woodward 看來,這正是產品經理應有的擔當:「使用者願意花時間告訴我們問題出在那兒,那就是在幫我們變得更好。」NotebookLM 團隊一名前設計師 Jason 回憶,Woodward 經常帶著從使用者社區蒐集的反饋走進會議室,對大家說「看看,這是使用者真正關心的,我們能做點什麼?」Jason 由衷佩服地說:「這種對終端使用者的承諾和執著,我在其他領導身上幾乎沒見過。」Woodward 平易近人的人格魅力也在這些「小事」中展露無遺。同事們常提起他的一個招牌舉動:當有團隊成員因為線上評論的批評而情緒低落時,Woodward 會故作誇張地哈哈一笑,用他那帶著中西部口音的爽朗笑聲打趣道:「走,一起回覆網友去!」據說,沒有人能抗拒他這富有感染力的笑聲——緊張的氣氛瞬間就被他化解了。前同事 Caesar Sengupta 曾打趣地評價:「我從沒見他對誰發過火。」這位與 Woodward 共事多年的Google前高管甚至半開玩笑地放言:「照這樣下去,他早晚會成為Google的 CEO。」雖然只是戲言,但也從側面反映出 Woodward 在Google內部的威望和人望之高。從奧克拉荷馬小鎮少年 到Google中流砥柱在成為Google AI 戰略幕後英雄之前,Josh Woodward 的人生軌跡並非典型的「矽谷精英」路線。他 1983 年出生於美國奧克拉荷馬州一個普通家庭,自幼成長於埃德蒙德(Edmond)小鎮。從小勤奮好學的 Woodward 考入了家鄉的俄克拉荷馬大學主修經濟學,2006 年以優異成績畢業,並被評為年度傑出畢業生之一。大學期間,他對公共事務和全球視野表現出濃厚興趣,積極參加各類學生領導力項目。畢業後,他獲得獎學金遠赴英國牛津大學深造,攻讀比較政府學,並於 2009 年拿下碩士學位。在牛津,他把研究重點放在美國軍事及經濟援助對外國民主處理程序的影響上——這一少有人問津的題目透露出他對「科技與社會」「力量與責任」等宏大命題的早期思考。也許正因如此,當他回到美國踏入科技行業時,能始終從更長遠的角度審視手中的技術。2009 年,Woodward 以產品管理實習生的身份加入Google,很快顯露出過人的敏銳和領導才能。他樂於接受具有挑戰性的任務,勇於從零開始打造新項目。在Google工作最初十年裡,他涉足多個前沿領域,從硬體裝置到新興市場,無不留下自己的印記:他參與了 Chrome 作業系統和首批 Chromebook 筆記本的開發;自告奮勇加入公司新成立的「NBU」計畫,去研究和服務印度等地第一次觸網的海量使用者,並因此被視為NBU項目的奠基人之一;後來又接手 Google Pay 的國際化拓展業務,為數億使用者帶去便捷的移動支付體驗。這些橫跨軟硬體、全球市場的經歷,讓 Woodward 對「如何讓技術普惠大眾」有了深刻理解。這種理念也貫穿在他之後負責的AI產品中——無論是 NotebookLM 還是 Gemini,他始終強調的是為使用者創造真正有用的價值,而不僅是炫技式的噱頭。Woodward 還有一個鮮明的個人標籤:酷愛閱讀且樂於分享。熟悉他的人都知道,他的辦公室和家中總是堆滿書籍,從商業傳記到科幻小說無所不讀。據說Google高管層每每想找本好書讀時,第一個諮詢的對象就是 Woodward。他至今堅持寫閱讀筆記,早年在 NBU 團隊時便每周編輯一封內部通訊,內容簡潔而發人深省,當時這封通訊在Google內部意外走紅,許多人聞訊後紛紛來信請求訂閱。如今儘管工作繁忙,他仍保持著每季度給團隊和朋友們寫一封「Josh 通訊」的習慣,分享自己近期讀到的有趣見解。身邊同事戲稱他是Google的「行走書單」。更難能可貴的是,Woodward 不僅博覽群書,還善於將知識活用於工作決策中。據前文提到的 Raiza 回憶,在 NotebookLM 項目開發過程中,Woodward 曾特地發給她一篇論文,探討使用者究竟能否信任AI聊天機器人的答案。這讓 Raiza 意識到,領導關心的不僅是產品功能實現,更是產品能否真正贏得使用者信任。類似的故事不勝列舉——他會建議團隊工程師閱讀科幻小說,從中獲得對未來技術的想像力;也會邀請人文學者來交流,提醒大家科技創新不能脫離人文關懷。這些細節都體現出 Woodward 作為領導者的深度與溫度。變革時代的掌舵者2025 年行將結束之際,Google憑藉在AI領域的一連串突破重新煥發了生機:從 Gemini 3 模型的橫空出世,到一個又一個「現象級」應用的推出,整個公司一掃年初的低迷,士氣高漲。CEO 桑達爾·皮查伊(Sundar Pichai)在全員大會上興奮地表示:「過去這一年的進展真是令人難以置信——Google各個團隊都在以前所未有的速度推出新功能。」而站在這股 AI 浪潮中央、備受矚目的,正是 Josh Woodward 和他所率領的團隊。展望 2026 年,業界對Google寄予厚望,期待這家科技巨頭繼續以 Responsible AI(負責任的人工智慧)的姿態領跑。在聚光燈之外,Woodward 依然埋頭忙碌著:既要帶領兩個部門創新競速,又要謹慎把關每一項技術的潛在影響。然而,這位久經考驗的「Google AI 掌櫃」臉上沒有焦慮,有的只是對未來的堅定信心和一絲藏不住的興奮。在最近的一次採訪中,當被問及如此高壓的工作如何堅持時,他爽朗一笑:「因為從未像現在這樣好玩啊!」對於熱愛挑戰的他來說,這或許正是真正的樂趣所在——身處巨變浪潮之巔,以初心為舵,划槳向前,讓技術的光芒照亮而非灼傷這個世界。 (新智元)
Scaling Law沒死! Gemini核心大佬爆料,Google已有顛覆性金鑰
Google大模型將迎顛覆升級! Gemini負責人爆料:長上下文效率與長度雙重突破在即,注意力機制迎來驚人發現。 Scaling Law未死,正加速演變!Google又要有重大突破了?最近,Google DeepMind的Gemini預訓練負責人Sebastian Borgeaud在採訪中給出重磅爆料——未來一年,大模型預訓練領域將在「長上下文處理效率」和「上下文長度擴展」兩大方向迎來重大技術創新。同時,Google Gemini三巨頭——Jeff Dean、OriolVinyalsML和Noam Shazeer罕見同台了,他們的對話中,跟Sebastian的內容展現出了驚人的一致。眾多高瞻遠矚、閃爍著智慧光芒的思想讓人深思。難怪,Google依然是那個巨人。Google大佬激動預言已破解大模型核心秘密Google DeepMind的Gemini預訓練負責人Sebastian Borgeaud在最近的訪談中表示,預計在未來一年內,針對提升長上下文處理效率以及進一步擴展模型上下文長度的預訓練技術,將會有重大創新。另外他還透露說,最近他們在注意力機制方面取得了一些非常有趣的發現,這可能會在未來幾個月內重塑他們的研究方向。對此,他表示非常興奮。而他提出了振聾發聵的一句話:Scaling Law並未消亡,只是正在演變!Sebastian Borgeaud是Gemini 3的預訓練負責人。這一次,是他首次接受部落格採訪,帶我們深入理解了Gemini 3背後的實驗室思維——變化究竟發生在那裡,為什麼現在的工作不再是“訓練模型”,而是建構一個完整的系統。Gemini 3背後:AI的未來正在加速到來一場意外的飛躍後,一個系統誕生了。「如果對自己誠實的話,我想……我們比我認為我們能達到的地方,走得更遠了。」坐在麥克風前的Sebastian Bourjou語氣平靜,但這句話卻像一顆投入湖面的石子,激起無限漣漪。為何Gemini 3會實現如此巨大的效能飛躍?Sebastian的回答看似很簡單:「更好的預訓練和更好的後期訓練」。然而,在這輕描淡寫的背後,卻是一個根本性的認知轉變。「我們不再只是在建立一個模型了,」他緩緩說道,「我認為,在這一點上,我們真正在建構的是一個系統。」而這,就是Gemini 3顛覆性進步的關鍵。人們常常想像,從一個Gemini版本到下一個版本,總有一些石破天驚的「秘密武器」。但Sebastian揭示的真相是:進步源於無數細微改進的聚合。是來自龐大團隊中,日復一日發現的那些「旋鈕」和最佳化。他還指出,AI發展範式正在經歷的潛在轉移:過去,我們彷彿擁有無限資料,可以隨意擴巨量資料集;而現在,我們正轉向一個「資料有限」體制。這意味著,未來的AI,必須學會更有效率地利用有限的資料資源,建構更複雜的系統工程。這也就是模型架構研究的核心價值。這一轉變,將迫使整個產業從「大力出奇蹟」的粗放模式,轉向「精雕細琢」的精細模式。未來的競爭焦點,將不再是「誰的資料中心更大」,而是「誰的學習演算法更有效率」、「誰的模型架構更優雅」、「誰能從有限資料中提取更多智慧」。而Gemini 3的大腦架構-混合專家模型MoE,代表了LLM發展的一條清晰路徑:從追求單純的「大」,轉向追求「大而高效,大而智慧」。AI的下一站——長上下文、高效檢索與「成本革命」展望未來幾年的技術前沿,Sebastian指出了激動人心的方向,它們將共同塑造下一代AI的能力和形態。1. 長上下文:從「短記憶」到「海量工作台」Gemini 1.5帶來的超長脈絡能力,已經是一場變革。 Sebastian預測,這方面的創新將持續加速。 「我認為未來一年左右,將在使長上下文更有效率、並進一步擴展上下文長度方面看到更多創新。」這不僅僅是“記住更多”這麼簡單。超長上下文將把模型變成一個真正的數字工作台:它可以同時載入整個程式碼庫、多篇科學研究論文、長時間對話歷史,並在其中進行連貫的分析、推理和創作。這為複雜的多步驟任務、深度研究和創作提供了前所未有的可能,是邁向更強大「智能體」的關鍵基礎設施。2. 注意力機制的進化Sebastian特別提到,在注意力機制上,「我們最近有了一些真正有趣的發現,我認為這將塑造未來幾個月的大量研究。」他對此「個人非常興奮」。這暗示著,被認為是當前大模型基石的注意力機制,仍有巨大的改進空間。更有效率、更強大或具備新特性的注意力機制,可能從底層顯著提升模型的理解、推理和計算效率,是推動性能邊界的重要槓桿。3. 檢索的回歸:讓模型學會「查資料」Sebastian早期曾主導「Retro」項目,研究讓模型在訓練和推理時檢索外部知識庫,而不是將所有知識死記硬背在參數中。他認為,這一方向遠未過時。「我內心深處相信,長期的答案是以可微分的方式學習這種能力。」這意味著,未來模型可能將檢索與推理更原生地結合,動態地從海量知識源中獲取資訊進行思考,而不是依賴後期「嫁接」的搜尋工具。這能讓模型更準確、更及時,並可能突破參數規模的知識容量限制。4. 效率與成本的「革命」一個日益凸顯的挑戰是:隨著使用者激增,模型的部署和服務成本變得至關重要。未來的研究將不再只追求性能峰值,還必須關注如何讓強大模型變得「便宜又好用」。我仍看不到盡頭採訪臨近尾聲,當我們把鏡頭拉回這位站在AI浪潮之巔的研究者本人時,Sebastian的回答透露著一種沈靜的樂觀與純粹的熱情。儘管探討了資料瓶頸、成本挑戰等現實問題,但Sebastian對AI進步的整體判斷依然充滿信心。「我已經多次提到這一點,但確實有如此多不同的事情會復合起來,還有許多有改進空間的方向。我現在真的看不到這類工作停止給我們帶來進步的任何盡頭。」這種信心並非盲目。它源於他作為一線領航者所目睹的:大量細微但確定的改進空間,以及整個領域尚未枯竭的創造活力。在他看來,至少在未來幾年,這種進步勢頭不會放緩。規模不再是神話 Noam Shazeer回歸後的第一桶冷水接下來,是Jeff Dean、Noam Shazeer、Oriol Vinyals三位大佬的對話。在會議中,我們能明顯感受到,Noam不再是那個把油門踩到底的激進派。他幾乎不主動談論「顛覆」,也很少用那些讓人血脈噴張的宏大詞彙。甚至一反常態,多次談到研發節奏、系統的穩定性,以及如何長期運作。作為Transformer的開創者,他曾經引領著大模型從無到有;現在,大模型一路高歌猛進,他卻停下來警告:大模型給出的答案太快,自我檢查的次數太少。他曾在公開場合反覆強調:現在的模型並不缺乏「聰明」,缺乏的是持續思考,並在複雜任務中反覆修正的能力。也就是說,大模型的規模依然重要,但它不再是決定一切的唯一變數。當Noam討論推理時,他明顯將重心從「能不能更強」移向了「能不能更穩定」。這是他回歸Google後,第一次在公開場合展現這種判斷。聽起來不像是否定過去,而更像是在承認一個事實:那條單純靠堆參數就能不斷前進的路,已經接近邊界了。頂級科學家的共識:一次高分,無法定義AI的未來Noam提到一個字:慢思考(Slow Thinking)。不只是簡單的放慢研發速度,而是反覆追問值不值、貴不貴、能不能被規模化複製。至此,智慧不再是一項抽象的能力,而是一項需要長期支付的工程開銷,需要和CPU、硬碟一起放進帳本裡討論。這一步一旦邁出去,許多過去衡量AI的標準,如Benchmark也慢慢失效。在整場會議中,三位頂級科學家沒有表現出對榜單的興奮,也沒有用「誰贏了誰」來定義進展。榜單擅長衡量瞬時表現,卻很難回答「能不能一直運行」這類長期問題。而Noam和Jeff反覆強調的,恰恰是後者:模型是否可靠、是否具備遷移能力、是否能在複雜任務中持續自我修正。這些能力,很難被壓縮成漂亮的數字。Gemini被當成System,而不是Model在這場對話裡,「System」出現的頻率極高,這顯然不是一種修辭。Noam和Jeff在描述Gemini時,刻意避開了「一個更強的模型」這種表述,而是反覆強調它是一個可以長期運行、不斷迭代的「系統」。「系統」和「模型」,聽起來差不多,但背後的邏輯天差地別。「模型」更像是一次性的成果,是在​​實驗室裡的瞬間表現;而「系統」更像基礎設施,它關心的是穩定性、可擴展性,以及在出現錯誤後能不能快速修復並繼續工作。對於Noam這類,極度強調架構設計、研發節奏和工程約束的人,天然會更在意一個系統能不能穩健地運行十年、二十年,而不是某一次響應速度有多快。在他們眼中,Gemini不是勝利者的獎品,而是一種「長期可用」的智慧形態。正因如此,整場對話沒有急於求成的產品宣發,沒有劍拔弩張的「對標某模型」。它更像是在對外強調:Google追求的不是曇花一現的成品,而是一套能重複使用、不斷進化的智慧工業體系。 (新智元)
🎯你被洗出場了嗎?美光大漲,台股將複製11/21劇本?!Line@連結:https://lin.ee/mua8YUP🎯這先股票誰先噴?2330台積電、2408南亞科、2317鴻海、5309系統電、3037欣興、4991環宇-KY📌台股連跌四天後,今日出現強力反彈相信大家都不會意外才對!因為這次又跟11月一樣這個畫面,跟11/21幾乎一模一樣。指數再一次精準回測仍上彎的生命線(季線後止跌),當時一堆人嚇到不敢看盤,結果呢?守住後直接展開新一波攻勢。📌再來看市場最怕的四個字:AI泡沫?美光最新財測已直接打臉市場:下季營收187億美元,市場只估142億;EPS 8.42美元,幾乎是預期的兩倍。美光執行長講得很白:「AI資料中心需求正在加速轉強。」這代表什麼?AI不但沒退燒,2026年才是真正主秀登場,從晶片競賽,走向大型資料中心大建設+AI應用全面落地。現在連蘋果都坐不住了。市場傳出2026年新版Siri將導入Google Gemini,當iPhone正式進化成AI Phone,又是一波換機潮!👇重點來了台股目前多頭可用之兵超多除了記憶體外,六大軍火庫已滿倉備戰:被動元件供不應求、2奈米設備滿單、CPO(矽光子)、高階ABF載板、低軌衛星全面啟動。最後結論:AI不是口號,是一條會把整條供應鏈一起拉上來的需求主線。這波拉回,再次證明:機會是留給有準備的人這次拉回又是彎腰撿鑽石的機會。🔴接下來我們會在粉絲團持續幫大家鎖定+追蹤,若還不知道該如何操作?那建議你務必要鎖定江江在Line @,將有更進一步的訊息給大家了解。https://lin.ee/mua8YUP🔴想了解還未起漲的市場主流,同步了解大盤多空轉折點及學習預測技術分析,江江YT節目都會持續追蹤+預告。https://reurl.cc/02drMk********************************************************有持股問題或想要飆股→請加入Line:https://lin.ee/mua8YUP江江的Youtube【點股成金】解盤:https://reurl.cc/02drMk*********************************************************(本公司所推薦分析之個別有價證券 無不當之財務利益關係以往之績效不保證未來獲利 投資人應獨立判斷 審慎評估並自負投資風險)
Gemini 3 Flash 可能是 Google 最狠的一步棋
剛剛Google正式推出了Gemini 3 Flash,這可能是 Google 這幾年最重要的一次模型發佈如果只看名字,Gemini 3 Flash 很容易被誤解成一個閹割版,快但不聰明的模型。但實際情況恰恰相反——它可能是 Google 到目前為止,戰略意義最大的一次模型選擇一句話先給結論:Gemini 3 Flash =前沿大模型智商 + 閃電級速度 + 超低成本的組合拳。它不是縮水版,而是把快和強第一次真正合在了一起不知道Google是怎麼訓練的,在複雜推理測試ARC-AGI-2和衡量真實程式設計能力測試SWE-bench Verified 基準中,Gemini 3 Flash都超過了Gemini 3 pro過去兩年,大模型世界裡一直有一道隱形分界線:一邊是能力最強、但又慢又貴的旗艦模型,另一邊是響應快、成本低,但明顯沒那麼聰明的輕量模型Gemini 3 Flash 做的事情,就是把這條分界線直接抹掉了它在多個博士級推理和多模態基準上,已經逼近甚至追平 Gemini 3 Pro 這樣的重型選手,卻同時保留了 Flash 系列最核心的特性——極低延遲和極高吞吐。更關鍵的是,在真實使用場景中,它平均比上一代 2.5 Pro 少用 30% 的 token,卻把正確率做得更高這件事對開發者的衝擊尤其明顯在 Agent、自動程式設計、高頻互動系統裡,真正的瓶頸從來不是模型能不能想明白,而是想明白要不要等三秒。Gemini 3 Flash 在 SWE-bench 這類面向程式碼 Agent 的評測中,甚至跑贏了 Gemini 3 Pro,本質原因只有一個:它足夠聰明,同時也足夠快,快到可以被反覆呼叫而當這種能力開始變便宜,事情的性質就變了Gemini 3 Flash 的定價已經低到一個明確的訊號:它不是拿來偶爾用一次的,而是拿來當基礎設施用的Google 直接把它設成了 Gemini App 的默認模型,全球使用者免費使用;同時,它也開始成為搜尋裡 AI Mode 的核心大腦。你在搜尋裡問一個複雜問題,它不只是給你答案,而是能拆解問題結構、結合即時資訊,再給你一個可以立刻行動的方案,而這一切幾乎和傳統搜尋一樣快這一步,其實比參數更重要如果說前兩年的競爭重點是誰的模型更像人類博士,那麼 Gemini 3 Flash 代表的,是下一階段的方向,誰能讓這種水平的智能,真正跑在每一次點選、每一次呼叫、每一次搜尋裡從這個角度看,Gemini 3 Flash 並不是一個Flash 模型,而是 Google 對 AI 規模化落地的一次明確表態:智能本身已經不是稀缺資源了,稀缺的是能被高頻使用的智能不得說GoogleTPU+強悍的研發能力已經成為事實上領先者了,Sam 昨天緊急推出的圖像模型追Nano Banana Pro,接下里要追的可能就多了,這在幾個月前甚至都不能想像 (AI寒武紀)
Google甩出“價格屠夫”!Gemini 3 Flash超Pro,成本僅1/4,速度如“閃電”
多領域性能比肩Pro模型。昨晚,Google發佈了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。具體來看,它輸出每百萬token的價格僅為Claude Sonnet 4.5的20%、GPT-5.2的21%,卻能在基準測試上達到甚至超越這些旗艦級模型的水平。即便是和Gemini 3 Pro相比,Gemini 3 Flash也極具性價比。Flash的價格僅為Pro的25%,卻在MMMU-Pro、SWE-bench Verified這些核心基準測試上,超過了Pro版本的模型。此前發佈的Gemini 3系列模型在複雜推理、多模態和視覺理解、智能體及Vibe Coding任務方面都展現出優勢,Gemini 3 Flash保留了這一基礎,將Gemini 3 Pro等級的推理能力與Flash等級的延遲、效率和成本相結合。Google首席科學家Jeff Dean稱,Gemini 3 Flash不僅比2.5 Pro質量更高,速度也快3倍,而且價格僅為後者的幾分之一。以下是並排演示:Gemini 3 Flash目前已經全面開放,開發者可通過Google AI Studio中的Gemini API、Gemini CLI以及智能體開發平台Google Antigravity使用。而普通使用者能通過Gemini應用程式和Google搜尋中的AI模式使用。01.專為迭代式開發打造還幫你“用嘴程式設計”Gemini 3 Flash究竟能做什麼?Google稱,這是一款專為迭代式開發打造的模型,能夠以低延遲提供接近Gemini 3 Pro等級的程式設計性能。Google分享了多個案例。比如,Gemini 3 Flash可以在一個手部追蹤的“彈球解謎遊戲”中實現多模態推理,提供近乎即時的AI輔助。它還可以近乎即時地建構和A/B測試新的載入動畫設計,簡化了從設計到程式碼的流程。使用多模態推理,Gemini 3 Flash可快速分析帶有上下文UI覆蓋層的圖像,並生成字幕,最終將靜態圖像轉化為互動式體驗。憑藉在推理、工具使用和多模態能力方面的出色表現,Gemini 3 Flash 特別適合希望進行更複雜視訊分析、資料提取和視覺問答的開發者。Gemini 3 Flash的多模態推理能力可用於幫助使用者看、聽和理解任何類型的資訊。使用者可以要求Gemini理解視訊和圖像,並在幾秒鐘內將該內容轉化為有幫助且可操作的計畫。Gemini應用程式中的Gemini 3 Flash可以分析短影片內容並給你一個計畫,比如如何改進你的高爾夫揮杆。由於Gemini 3 Flash針對速度進行了最佳化,它可以在你仍在繪圖時就“看到”並猜出你畫的是什麼。你可以上傳一段錄音,Gemini 3 Flash將識別你的知識盲點,建立一個自訂測驗,並對答案給出詳細解釋。或者,也可以嘗試“用嘴程式設計”,僅用語音輸入從零開始建構有趣、有用的應用程式。Gemini 3 Flash可以在幾分鐘內將非結構化的想法轉化為一個功能正常的應用程式。02.多領域性能超越Pro級模型可自動調節思考量Gemini 3 Flash在基準測試上表現如何?它在GPQA Diamond(90.4%)和Humanity's Last Exam(不使用工具時為33.7%)等博士級推理和知識基準測試中,可與更大的前沿模型相媲美,並且在多項基準測試中顯著優於Gemini 2.5 Pro。在評估編碼智能體能力的基準測試SWE-bench Verified中,Gemini 3 Flash取得78%的成績,不僅超越了2.5系列,也超過了Gemini 3 Pro。它還在MMMU Pro上達到了81.2%的分數,與Gemini 3 Pro相當,實現了最先進的性能。在下圖中展示的基準測試中,Gemini 3 Flash在幾乎所有基準測試上都超過了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。除了前沿等級的推理和多模態能力外,Gemini 3 Flash的建構旨在實現高效率,推動了質量與成本、速度之間的帕累托邊界。下方散點圖顯示了多個語言模型的LMArena Elo得分與每百萬tokens價格的關係,其中一條線標出了穿過Gemini 3 Pro、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托邊界。在思考預算拉滿時,Gemini 3 Flash能夠調節其思考量。對於更複雜的用例,它可能會思考更長時間。但根據典型流量測量,在以更高的性能精準完成日常任務的前提下,它平均比2.5 Pro少使用30%的tokens。03.結語:Gemini 3模型版圖補全有望深度嵌入日常應用Gemini 3系列模型自發佈以來就廣受好評,不過其高昂的成本讓不少使用者望而卻步。Gemini 3 Flash補全了Gemini 3家族在輕量化、高性價比方面的佈局,回應了開發者在真實生產環境裡的訴求。從迭代式開發、Vibe Coding,到多模態應用、即時互動和智能體系統,Gemini 3 Flash所展現的更高性價比,有望幫助智能更廣泛地嵌入日常應用和商業系統之中。 (智東西)
Google殺瘋了!Gemini 3 Flash 突襲:這個跑腿小弟差點打敗了 GPT-5.2
一個月前,Google發佈了最新的 Gemini,從此我們進入了 Gemini 3 的時代。那以後, Gemini 3 Pro 就成了我幹活的主力。但說實話,它反應是真慢,而且很多時候我只是問些簡單問題,完全沒必要深度思考。所以,一直期待速度飛快的 Flash 系列重新回來。終於,在今天,Gemini 3 Flash 來了!圖:Google CEO 宣佈 Gemini 3 Flash 發佈Google這一波操作屬實把我驚到了。官方號稱它“比快更快”,而且智商不減反增。本來是一個“小弟”人設,但你看看它排名,居然僅次於OpenAI 最新的模型 GPT 5.2了。(就差 2 分)真讓人情何以堪吶?圖:第三方機構評測 Gemini 3 Flash 的綜合指標廢話不多說,咱們趕緊來扒一扒,這個新出的 Flash 到底香不香。01 到底是個啥?簡單來說:把 Pro 的腦子,裝進了 Flash 的身體裡。以前我們對“Flash(輕量級)”模型的印象是什麼?跑得快,便宜,但是……有點“笨”。處理複雜任務時經常翻車。但這次 Gemini 3 Flash 徹底打破了這個刻板印象。遇到閒聊、簡單查詢: 它就輕裝上陣,秒回,省流又省錢;遇到燒腦難題: 它能立馬調動深層算力,像老教授一樣深思熟慮。它大腦似乎有個變速箱。它甚至在性能、成本和速度方面突破了帕累托極限。(AI 界的性價比極限)圖:Gemini 3 Flash 在性能、成本和速度方面突破了帕累托極限官方資料顯示,它的 Token 消耗比 Gemini 2.5 Pro 少了 30%,但智商卻線上。說人話就是:多快好省!圖:Token 消耗率對比這種“該省省,該花花”的 AI,誰不愛?02 憑資料說話:這波“以下犯上”有點狠咱們不整那些虛頭巴腦的形容詞,直接看跑分資料,Google這次是真的下了血本。我看了一眼實測資料,甚至有點不敢相信:它在很多任務上接近自家最強的模型 3 Pro,甚至有些指標還幹掉了Pro 版。(這樣禮貌嗎?)特別是那個讓無數 AI 汗流浹背的 ARC-AGI-2 測試……還讓人意想不到的是:Gemini 3 Flash 全面碾壓了上一代的旗艦版本 2.5 Pro。(前浪死在沙灘上)圖: Gemini 3 Flash 的各項指標先說說這個 ARC-AGI-2。之前 GPT 5.2 發佈讓大家印象深刻,其中有一個原因就是這個指標碾壓所有模型。老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一, 主要測試模型到底有沒有腦子。它是由 Keras 之父 François Chollet 搞出來的,專門用來反死記硬背的。比如這種題目:圖:ARC-AGI 2 題目以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現原形,得分低得可憐。這項指標 Flash 竟然超過了自己的 Pro 大哥,僅次於 GPT-5.2!這個小弟,要造反了有點腦子!在另一項指標: GPQA Diamond(研究生等級的專家推理測試)裡,它拿了 90.4 分。意思就是智商堪比博士。看這個數字,它的推理能力已經和那些大塊頭的前沿模型(Pro 版)平起平坐了。在著名的“Humanity's Last Exam(人類最後一場考試)”這種地獄級難度的測試裡,Gemini 3 Flash 居然考出了 43.5% 的高分(Tools on 模式)。圖:HLE 分數對比它跟 GPT-5.2(45.5%)這種超級旗艦模型,只差了不到 2 分!朋友們,別忘了,這可是一個 Flash 模型啊!它的定位本來是“跑腿小弟”,結果一不小心把“業界大佬”們的飯碗給砸了。(面子?不存在的。)這那裡是“輕量版”,這分明是“披著閃電俠外衣的超人”。在多模態測試(MMMU Pro)中得分 81.2%,看圖、看視訊的能力基本和 Gemini 3 Pro 五五開。也就是,眼神兒更好使。圖:MMMU-Pro 指標對比最讓我意外的是這個——在 SWE-bench Verified(程式碼智能體測試)中,它得分 78%。直接超越了 Gemini 2.5 全系,甚至在某些這就需要改程式碼的任務上,比 Gemini 3 Pro 還要好用!本來以為它動動嘴還行,沒想到寫程式碼更溜!一句話總結:它不是“丐版”,它是“精簡版戰神”。03 為什麼我建議你立馬換用 Flash?作為這一年多幾乎天天都在用 AI 的人,我覺得 Gemini 3 Flash 帶來的改變是肉眼可見的:1. 真的太快了!⚡️根據第三方測評(Artificial Analysis),它的速度是 2.5 Pro 的 3 倍。以前問 AI 一個問題,你可能還得切出去回個消息等它寫完。現在?你字剛打完,它答案就懟到你臉上了。這種“跟手”的感覺,對於我們需要快速寫文案、改程式碼的人來說,簡直是救命。2. 價格那是相當感人 💰圖:Gemini 3 Flash 價格輸入 100 萬 Token 只要 0.5 美刀,輸出只要 3 美刀。想想看,它現在比 2.5 Pro 強太多了,但價格卻只有它的 30-40%。這基本就是白菜價了,對於開發者來說,成本焦慮直接減半。3. 智商不掉線既有速度,又有 Pro 級的推理能力。處理複雜的長文件分析、視訊理解,它完全都在行。04 怎麼用?能幹啥?好消息是,這玩意兒現在就是 Gemini 的“默認配置”。不管你是普通使用者還是開發者,現在就能上手玩。普通玩家:直接打開 Gemini App 或者 Google 搜尋,它已經在那裡等你了(是的,免費用)。我們打開 Gemini,會看到 Fast 和 Thinking 兩個新增的模型。它們就是 Gemini 3 Flash!圖:Gemini 3 Flash開發者大佬:去 Google AI Studio 或者 Vertex AI 就能調 api。因為它延遲極低,拿來做那種需要即時反饋的語音助手、視訊分析工具簡直完美。05 寫在最後至此,Gemini 3 家族算是真正“齊活”了。Pro 是全能六邊形戰士;Deep Think 是深思熟慮的掃地僧;Flash 則是身手敏捷的急先鋒。回顧這一年,不得不說Google是真聽勸,也是真拼。以前總有人吐槽大廠喜歡“擠牙膏”,但這幾次發佈,從 Pro 到 Deep Think 再到今天的 Flash(還有 Nano Banana Pro),每一次都是誠意滿滿的“硬菜”。特別是今天的 Flash,說實話,雖然在Google家裡它定位是“小弟”,但這性能、這智商,放在其他任何一家公司,高低得掛個“旗艦(Ultra/Pro)”的名號。當然,神仙打架,受益的是咱們。你們打吧,我喜歡。 (AI范兒)
Gemini 3 Flash閃電來襲:智力竟反超Pro!速度快3倍,全球免費
【新智元導讀】Google在2025年底甩出「王炸」:Gemini 3 Flash! 這款模型徹底打破了「快就一定笨、強就一定貴」的定律,以3倍於前代的速度實現「零延遲」響應,甚至在程式設計和邏輯推理上反超了Pro級大哥。Gemini 3 Flash正式發佈!至此,Gemini 3家族成為完全體:Flash、Pro和Deep Think。Flash模型已經全面上線Gemini APP、AI Studio、Google Antigravity和Gemini CLI,使用者打開Gemini就是默認Gemini 3 Flash版本,直接免費使用!如果說之前的AI模型是在模擬人類的思考,那麼Gemini 3 Flash就是在模擬人類的「直覺」。3倍於Gemini 2.5 Pro的速度,卻擁有超越Pro級的推理能力。這不僅僅是一次升級,這是對現有AI互動體驗的一次降維打擊!實測Gemini 3 Flash之後,只有一個感受:快!簡直太快了。速度快到「沒有載入條」,這種體驗簡直是「零延遲」的魔法,剛敲完回車,答案就已經在螢幕上渲染完畢。它不僅快得離譜,更可怕的是,它的智力竟然在某些領域直接「背刺」了自家的Pro大哥。通常「Flash」意味著「降智」,但這次不同。Gemini 3 Flash在某些複雜的Agentic Coding(智能體程式設計)任務上,甚至直接超越了Gemini 3 Pro!比如Flash在MMMU Pro(多模態理解和推理)上取得了81.2%,反超Gemini 3 Pro的81.0%,要知道從API成本來看,相比Gemini 3 Pro,Flash成本直接砍到了四分之一。更便宜,但是性能反而不降反升!估計今夜Google又讓整個大模型行業「集體失眠」了。拳打Claude,腳踢GPT在Artificial Analysis的最新評估中,3 Flash相比上一代2.5 Flash直接來一次質變飛躍,這應該是2025年同個系列模型的最大跨度升級!很難想像,一個Flash輕量級模型能夠超過Cladue的旗艦模型Opus 4.5。(估計相比OpenAI,Anthropic對一個坐不住了)。其他指標,Flash也達到了最頂級模型的水平。Flash在GPQA Diamond(90.4%)和Humanity’s Last Exam(無工具列件下33.7%)等博士級推理和知識基準測試中展現了前沿性能,足以媲美更大的前沿模型,並且在多項基準測試中顯著優於前代旗艦Gemini 2.5 Pro。在ARC-AGI Semi-Private Eval上,Gemini 3 Flash的表現同樣極具競爭力,且成本大幅低於其他前沿模型。ARC-AGI-1: 84.7%, $0.17/任務ARC-AGI-2: 33.6%, $0.23/任務在LMArena上,Gemini 3 Flash的文字能力直接躍升至第3!Gemini 3 Flash證明了速度和規模並不一定要以犧牲智能為代價。除了前沿級的推理和多模態能力外,Gemini 3 Flash專為高效而生,推動了質量與成本、速度之間的帕累托前沿(Pareto frontier)。在進行最高層級的思維處理時,Gemini 3 Flash能夠調節其「思考量」。對於更複雜的用例,它可能會思考更久,但在典型流量下,它平均比2.5 Pro少消耗30%的Token,卻能以更高的性能精準完成日常任務。Gemini 3 Flash的核心優勢在於其原生速度!它的表現優於2.5 Pro,但速度快了3倍(基於Artificial Analysis基準測試),而成本卻只是零頭。Gemini 3 Flash的定價為每百萬輸入Token 0.50美元,每百萬輸出Token 3美元(音訊輸入保持在每百萬輸入Token 1美元)。開發者新寵:極速與深度的完美平衡對於開發者來說,模型的響應速度是第一位。Gemini 3 Flash專為迭代開發打造,提供Gemini 3 Pro級的編碼性能和低延遲——它能夠在高頻工作流中快速推理並解決任務。在評估編碼智能體能力的SWE-bench Verified基準測試中,Gemini 3 Flash獲得了78%的分數,不僅超越了2.5系列,還超過了Gemini 3 Pro。可以說,它在智能體編碼、生產級系統和響應式互動應用之間實現了理想的平衡。與此同時,Gemini 3 Flash在推理、工具使用和多模態能力方面的強勁表現,非常適合希望進行更複雜的視訊分析、資料提取和視覺問答的開發者。這意味著它可以賦能那些景既需要極速響應,也需要深度推理的更智能的應用程式。比如,Gemini 3 Flash能在一款手部追蹤的「彈球益智遊戲」中實現多模態推理,提供近乎即時的AI輔助。或者,近乎即時地建構並A/B測試新的載入動畫設計,幫助簡化了從設計到程式碼的流程。以及,根據非常簡單的一段提示詞,編寫出三種獨特的設計變體。甚至,還能通過多模態推理分析圖像,並生成帶有上下文UI覆蓋層的字幕,來將靜態圖像轉化為互動體驗。全民AI時代:搜你想搜,做你想做Gemini 3 Flash現已成為Gemini App中的默認模型,取代了2.5 Flash。這意味著全球所有的Gemini使用者都將免費獲得Gemini 3的體驗,讓處理日常任務的能力得到重大升級。得益於Gemini 3 Flash驚人的多模態推理能力,你可以用它來幫助你更快地看、聽和理解任何類型的資訊。例如,你可以讓Gemini理解你的視訊和圖像,並在幾秒鐘內將這些內容轉化為有用且可執行的計畫。比如,它可以通過分析短影片的內容,來為你制定改善高爾夫揮桿動作的計畫。上傳一段音訊錄音,Gemini 3 Flash會識別你的知識盲區,建立一個定製測驗,並針對答案給出詳細解釋。此外,針對速度進行最佳化了的Gemini 3 Flash,還能在你畫草圖時就猜出你在畫什麼。或者,即便沒有任何程式設計知識,你也可以僅用語音從頭開始快速建構有趣、實用的App。只需隨時隨地口述給Gemini,它就能在幾分鐘內將你原本非結構化的想法轉化為功能完善的App。Gemini 3 Flash也開始作為搜尋中AI模式的默認模型推出,面向全球使用者開放。建立在Gemini 3 Pro的推理能力之上,採用Gemini 3 Flash的AI模式在解析問題的細微差別方面更加強大。它會考量你查詢的方方面面,提供深思熟慮、全面且視覺上易於消化的回答——並從全網提取即時的本地資訊和有用的連結。結果有效地結合了研究與即時行動:你能在獲得特定推薦的同時得到智能梳理的內容細分——一切都以搜尋的速度呈現。當處理涉及多重考量的複雜目標時,這一點尤為出色,比如試圖規劃一次說走就走的旅行,或快速學習複雜的教育概念。收官2025:留給對手的時間不多了Gemini 3 Flash的發佈傳遞了一個清晰的訊號:高性能AI不再昂貴,也不再遲鈍。Gemini 3 Flash的邏輯很簡單:比我聰明的沒我快,比我快的沒我聰明,關鍵是它們都比我貴。Google正在用極其激進的策略——頂級推理+極致速度+地板價格,試圖在2025年底收割戰場。對於普通使用者來說,Gemini App裡的對話將變得極其流暢;對於開發者來說,建構即時、複雜的AI應用不再是燒錢的夢想,因為API真的太便宜了。2025年是充滿挑戰的一年,AI真正邁入了一個新時代,模型不再只是演示品,而是被大規模使用的日用品。Google這一年並未追逐單一旗艦模型,他們推出了一系列產品陣容,而且每個模型都特別能打:追求速度,選Flash追求深度,選Pro追求推理,選Deep Think開啟「智能平權」時代Gemini 3 Flash發佈最大的顛覆之處還是在Agentic Coding等任務上超過Gemini 3 Pro。過去AI圈的邏輯是「大就是好」,但Gemini 3 Flash的意義在於它開啟了「智能平權」時代:徹底降維打擊低成本模型市場:在3 Flash出現之前,開發者在「便宜但笨」(如 GPT-4o-mini, 2.5 Flash)和「聰明但貴且慢」(如Pro)之間痛苦抉擇。Gemini 3 Flash把Pro級的智力拉到了Flash級的價格和速度,直接封死了競品低端模型的生存空間。為智能體時代鋪路:智能體工作的核心是「循環(Loop)」——思考、行動、觀察、再思考。如果模型太慢或太貴,這個循環就無法跑通。Flash極高的Token/秒/美元效率,是智能體能大規模商用的唯一基石。建構「延遲感」護城河:Google意識到,在搜尋和互動中,100ms的延遲差異比5%的精準度差異更能決定使用者留存。Flash的「瞬發」感讓它在AI搜尋模式下擁有了類似傳統搜尋的爽快感。現在的壓力,全部來到了OpenAI這邊。奧特曼,還坐得住嗎?是不是又要拉響紅色警報了~彩蛋目前來看,AI捲到Gemini 3 Flash這個程度感覺已經到頭了。我們試著用Gemin 3 Flash「套磁」了一下Gemini 4會在什麼時候推出,能夠達到什麼水平?還是有驚喜的。Gemini 4可能在2026年Google I/O大會推出(不過按照今年2.5的規律,大機率會是3.5)。而3 Flash給的另一點則更加有意義,如果說Gemini 3是推理和速度的完美極致,那麼下一代模型將聚焦於:智能體的主動性真正理解物理世界長程記憶以及超越人類的科學發現真是太期待明年的到來了!(新智元)